05_Hypothesis testing

Author

Yeong Chan Lee

Published

April 6, 2023

5-1. 가설검정

데이터셋

가설 검정을 위해 데이터셋을 하나 선정하겠습니다.

library(medicaldata)
head(licorice_gargle)
  preOp_gender preOp_asa preOp_calcBMI preOp_age preOp_mallampati preOp_smoking
1            0         3         32.98        67                2             1
2            0         2         23.66        76                2             2
3            0         2         26.83        58                2             1
4            0         2         28.39        59                2             1
5            0         1         30.45        73                1             2
6            0         2         35.49        61                3             1
  preOp_pain treat intraOp_surgerySize extubation_cough pacu30min_cough
1          0     1                   2                0               0
2          0     1                   1                0               0
3          0     1                   2                0               0
4          0     1                   3                0               0
5          0     1                   2                0               0
6          0     1                   3                0               0
  pacu30min_throatPain pacu30min_swallowPain pacu90min_cough
1                    0                     0               0
2                    0                     0               0
3                    0                     0               0
4                    0                     0               0
5                    0                     0               0
6                    0                     0               0
  pacu90min_throatPain postOp4hour_cough postOp4hour_throatPain pod1am_cough
1                    0                 0                      0            0
2                    0                 0                      0            0
3                    0                 0                      0            0
4                    0                 0                      0            0
5                    0                 0                      0            0
6                    0                 0                      0            0
  pod1am_throatPain
1                 0
2                 0
3                 0
4                 0
5                 0
6                 0

리코리스(민감초) 가글이 수술 후 인후통(postoperative sore throat)과 발관 후 기침(postextubation coughing)을 줄여 줄 수 있다는 RCT연구입니다.(Ruetzler et al. 2013)

참가자 236명(최종 235명)을 treatment(licorice)그룹과 reference(sugar-water)그룹으로 랜덤하게 배정하고 elective thoracic surgery 이전 마취 전 5분 동안 가글을 하도록 하였습니다. 수술 후 postanesthesia care unit (PACU) 도착 이후 30분, 90분, 4시간, 수술후 다음날에 관련 지표를 평가하였습니다. 자세한 설명은 논문과 description, codebook을 통해 익히도록 합니다.

Table 1

Table 1 테이블을 R코드를 활용해 만들어봅시다.Table 1에서는 두 군간 비교를 Standardized difference로 보여주지만 우리는 p-value로 보여주도록 합니다. moonBook 패키지의 mytable()함수를 활용하겠습니다.

library(moonBook)

licorice_gargle$treat2 <- ifelse(licorice_gargle$treat == 1, "0Licorice", "1Sugar-water")
  
mytable(treat2~preOp_age+preOp_gender+preOp_calcBMI+preOp_smoking+preOp_pain+preOp_asa+preOp_mallampati+intraOp_surgerySize, data=licorice_gargle, digits=0)

        Descriptive Statistics by 'treat2'        
——————————————————————————————————————————————————— 
                      0Licorice  1Sugar-water   p  
                       (N=118)     (N=117)   
——————————————————————————————————————————————————— 
 preOp_age             57 ±   15   58 ±   16  0.513
 preOp_gender                                 0.631
   - 0               69 (  58%)   73 (  62%)       
   - 1               49 (  42%)   44 (  38%)       
 preOp_calcBMI         26 ±    4   26 ±    4  0.925
 preOp_smoking                                0.995
   - 1               45 (  38%)   45 (  38%)       
   - 2               36 (  31%)   36 (  31%)       
   - 3               37 (  31%)   36 (  31%)       
 preOp_pain                                   0.474
   - 0               118 ( 100%) 115 (  98%)       
   - 1                0 ( 0.0%)   2 (   2%)        
 preOp_asa                                    0.869
   - 1               22 (  19%)   19 (  16%)       
   - 2               67 (  57%)   67 (  57%)       
   - 3               29 (  25%)   31 (  26%)       
 preOp_mallampati                             0.515
   - 1               39 (  33%)   31 (  26%)       
   - 2               66 (  56%)   69 (  59%)       
   - 3               13 (  11%)   16 (  14%)       
   - 4                0 ( 0.0%)   1 (   1%)        
 intraOp_surgerySize                          0.451
   - 1               32 (  27%)   24 (  21%)       
   - 2               75 (  64%)   83 (  71%)       
   - 3               11 (   9%)   10 (   9%)       
——————————————————————————————————————————————————— 

Table 1과 동일한 결과를 얻었습니다. mytable()함수에서 digits 옵션을 활용하면 반올림하는 자릿수를 변경할 수 있습니다.

이 변수들을 활용해 여러 가설 검정을 해봅시다.

One-sample t-test

Licorice그룹에서 나이의 모평균이 57세인지 혹은 아닌지 검정해봅시다. 모분산은 모른다고 가정하고 나이는 대체로 정규분포를 따르기 때문에 이때는 One-sample t-test를 진행하면 됩니다. 이때의 귀무가설, 대립가설은 다음과 같습니다.

\[ H_0: \mu=57 \quad H_1: \mu \neq 57 \]

library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
lico <- filter(licorice_gargle, treat2 == "0Licorice")
t.test(lico$preOp_age, mu = 57)

    One Sample t-test

data:  lico$preOp_age
t = -0.21061, df = 117, p-value = 0.8336
alternative hypothesis: true mean is not equal to 57
95 percent confidence interval:
 54.00244 59.42129
sample estimates:
mean of x 
 56.71186 

t.test 결과에 alternative hypothesis: true mean is not equal to 57 으로 설정된 것이 보이시나요? 저희가 설정한 대립가설과 동일한가요? 그때의 t 통계량은 몇인가요? 자유도는 몇 인가요? p-value와 95% CI는 어떻게 되나요?

모평균이 65세인지 아닌지 검정을 하려면 어떻게 할까요?

t.test(lico$preOp_age, mu = 65)

    One Sample t-test

data:  lico$preOp_age
t = -6.0582, df = 117, p-value = 1.718e-08
alternative hypothesis: true mean is not equal to 65
95 percent confidence interval:
 54.00244 59.42129
sample estimates:
mean of x 
 56.71186 

95% CI, 표본평균은 똑같은데 t 통계량, p-value가 달라지는 것이 이해되시나요? two-sided 95% CI를 직접 구해보겠습니다.

mean_age <- mean(lico$preOp_age)
sd_age <- sd(lico$preOp_age)
t_statistic <- qt(0.975, df=(nrow(lico)-1))

mean_age - t_statistic * (sd_age/sqrt(nrow(lico)))
[1] 54.00244
mean_age + t_statistic * (sd_age/sqrt(nrow(lico)))
[1] 59.42129

모평균이 65세인지 아닌지에 대한 가설을 검정을 하기 위해 t 통계량은 어떻게 구하나요?

t_statistic <- (mean_age-65)/(sd_age/sqrt(nrow(lico)))
t_statistic
[1] -6.058189

Two-sample t-test

두 그룹간 평균 비교를 하는 two-sample t-test를 해보겠습니다. treatment 그룹과 reference 그룹의 나이 평균을 비교하겠습니다. 귀무가설과 대립가설을 설정합니다. 각 그룹의 데이터을 쉽게 추출할 수 있다면 비교는 어렵지 않습니다.

\[ H_0: \mu_1=\mu_2 \quad H_1: \mu_1 \neq \mu_2 \]

t.test(filter(licorice_gargle, treat2 == "0Licorice")$preOp_age,
       filter(licorice_gargle, treat2 == "1Sugar-water")$preOp_age)

    Welch Two Sample t-test

data:  filter(licorice_gargle, treat2 == "0Licorice")$preOp_age and filter(licorice_gargle, treat2 == "1Sugar-water")$preOp_age
t = -0.65453, df = 231.24, p-value = 0.5134
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -5.302816  2.658169
sample estimates:
mean of x mean of y 
 56.71186  58.03419 

t.test()함수는 기본적으로 unequal variance를 가정합니다. ?t.test를 해서 여러 옵션들을 확인합시다.

F test

두 그룹간 분산이 같은지 검정하기 위해서 F test를 할 수 있습니다. treatment 그룹과 reference 그룹의 나이의 분산을 비교하겠습니다.

\[ H_0: \sigma_1=\sigma_2 \quad H_1: \sigma_1 \neq \sigma_2 \]

var.test(filter(licorice_gargle, treat2 == "0Licorice")$preOp_age,
       filter(licorice_gargle, treat2 == "1Sugar-water")$preOp_age)

    F test to compare two variances

data:  filter(licorice_gargle, treat2 == "0Licorice")$preOp_age and filter(licorice_gargle, treat2 == "1Sugar-water")$preOp_age
F = 0.85421, num df = 117, denom df = 116, p-value = 0.3962
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.592927 1.230275
sample estimates:
ratio of variances 
         0.8542099 

결과에 대해 직접 해석해보시기 바랍니다. 이와 같이 등분산 검정을 하는 데 있어 Levene’s test를 많이 씁니다. Levene’s test는 두 그룹이상의 비교도 가능하기 때문에 귀무가설과 대립가설이 다음과 같습니다.

\[ \text{H}_0 : \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2 \quad \text{H}_1 : \text{적어도 하나의 }\sigma_i^2\text{가 다른 분산과 다르다} \]

#install.packages("lawstat")
library(lawstat)
Warning: package 'lawstat' was built under R version 4.2.3
levene.test(licorice_gargle$preOp_age, factor(licorice_gargle$treat2))

    Modified robust Brown-Forsythe Levene-type test based on the absolute
    deviations from the median

data:  licorice_gargle$preOp_age
Test Statistic = 0.37951, p-value = 0.5385

References

Ruetzler, Kurt, Michael Fleck, Sabine Nabecker, Kristina Pinter, Gordian Landskron, Andrea Lassnigg, Jing You, and Daniel I. Sessler. 2013. “A Randomized, Double-Blind Comparison of Licorice Versus Sugar-Water Gargle for Prevention of Postoperative Sore Throat and Postextubation Coughing.” Anesthesia & Analgesia 117 (3): 614–21. https://doi.org/10.1213/ane.0b013e318299a650.